home *** CD-ROM | disk | FTP | other *** search
/ MacFormat 1996 March / macformat-035.iso / Shareware City / Science / DNA stacks 1.1 / Sample Input⁄Output / Specialized Instructions / Gene Map Matrix Instructions next >
Encoding:
Text File  |  1995-07-31  |  5.5 KB  |  96 lines  |  [TEXT/QED1]

  1. AA    Bta1    Bta2:MT    Bta3:16338    Bta4:Bos taurus    Bta5    Bta6    Dya1    Dya2:MT    Dya3:16019    Dya4:Drosophila yakuba    Dya5    Dya6    ZA    ZB    ZC
  2. AT6    15.93    20.08    7    +    8290    8967    16.18    20.38    7    +    4066    4739    AT    6    ATPase 6
  3. AT8    14.95    16.15    6    +    8129    8326    15.21    16.22    6    +    3911    4072    AT    8    ATPase 8
  4. CO1    0    9.43    1    +    5687    7228    0    9.58    1    +    1474    3009    CO    1    CO I
  5. CO2    10.33    14.49    4    +    7374    8054    10.04    14.31    3    +    3083    3767    CO    2    CO II
  6. CO3    20.09    24.88    8    +    8970    9752    20.39    25.31    8    +    4740    5528    CO    3    CO III
  7. CYB    54.03    60.98    20    +    14514    15650    56.44    63.53    24    +    10515    11651    CY    B    Cyt B
  8. ND1    84.17    90    28    +    3101    4054    63.87    69.95    26    -    11706    12680    ND    1    ND 1
  9. TRS    9.44    9.87    2    -    7229    7299    63.57    63.98    25    +    11658    11723    TR    S    Ser tRNA (UGA-UCN)
  10. TRT    61.02    61.45    21    +    15657    15726    52.3    52.7    21    +    9852    9916    TR    T    Thr tRNA
  11. TRV    73.67    74.08    25    +    1386    1452    78.71    79.15    29    -    14082    14153    TR    V    Val tRNA
  12. TRW    97.68    98.08    33    +    5308    5374    98.71    99.12    35    +    1267    1333    TR    W    Trp tRNA
  13. TRX    38.87    39.3    16    +    12038    12108    70.02    70.42    27    -    12691    12755    TR    X    Leu tRNA (UAG-CUN)
  14. TRY    99.58    99.99    37    -    5618    5685    99.54    99.96    37    -    1401    1468    TR    Y    Tyr tRNA
  15. TRZ    38.5    38.86    15    +    11977    12036    29.5    29.92    14    +    6200    6267    TR    Z    Ser tRNA (GCU-AGY)
  16.  
  17.  
  18. Above is a small portion of the animal mtDNA gene map matrix, to illustrate the
  19. format required. Try to follow this format as closely as possible, for reasons
  20. that are mostly obscure and related to the creation of gene maps in DNA Translator.
  21. and sorting capabilities of Excel. There may be a more logical or more efficient format,
  22. but these might require rewrites of scripts. The following discussion assumes
  23. that Microsoft Excel is being used to maintain the database. Other spreadsheet
  24. programs should work equally well. The files should be saved as "Text Only"
  25. (tab delineated) or "CSV" (comma delineated) before import to DNA Translator,
  26. but you may find it wise to also save your matrix in Excel format. Note that
  27. you can control the number format of particular columns if you are satisfied with,
  28. e.g., 2 or 3 digit accuracy, but once saved as text the original accuracy is lost.
  29.  
  30. The first line is a header line, which includes important information about included
  31. molecules as well as a format which can be sorted for generation of gene order
  32. information (Eernisse, in prep.). The first and last three columns are named for
  33. sorting alphabetically, and these columns contain, respectively: 1) gene or feature 
  34. short abbrev. (button name on gene map with certain exceptions, i.e., tRNAs); 
  35. 2) same as 1st 1 to n-1 characters of abbreviation; 3) last character of abbreviation; 
  36. 4) full or shortened gene name that you wish to display. In between these columns
  37. are the gene data columns for 1 or more molecules, six per molecule. The header column
  38. is named in a set format, e.g., "Bta1,Bta2:MT,Bta3:16338,Bta4:Bos taurus,Bta5,Bta6"
  39. here tab-delimited (comma-delimited should work as well). "Bta" is derived from the 
  40. first letter of the genus name and first two letters of the species name, followed by 
  41. the number of the column. Columns 2-4 are appended by important information. If the 
  42. molecule is mitochondrial or chloroplast DNA, column 2 (Bta2) should be appended by 
  43. ":MT" or ":CP". Append column 3 (Bta3) by the entire length of the molecule (important).
  44. Append column 4 (Bta4) by the complete "Genus species" name the molecule was extracted 
  45. from (important).
  46.  
  47. [7/31/95: Above is still more or less current except that I now store additional
  48. info: Bta5:Accession Number, Bta6:Common Name. The latter is especially advised
  49. because I am up to 26 animal mtDNA maps. Also, the various taxa are now arranged
  50. phylogenetically, rather than alphabetically.]
  51.  
  52. To enter a new molecule in an existing matrix, follow this procedure:
  53.  
  54. 1a) use GenBank/EMBL sequence import with creation of a "map matrix" on a utility
  55. card of DNA Translator. This will do most of the work for a single molecule
  56. map.
  57.  
  58. or:
  59.  
  60. 1b) type in the coordinates and features manually in spreadsheet columns, following
  61. the above example.
  62.  
  63. 2) open the matrix in something like Excel, and edit the feature names as I have
  64. done in the above example so that short meaningful button names will be displayed.
  65.  
  66. 3) if you have more than one molecule that are comparable, you may want to combine
  67. them as I have above. Repeat step 1 for each, and combine them in a single 
  68. spreadsheet, taking care that the right coordinates are placed with the right
  69. features (i.e., sort first alphabetically by feature). This will require that
  70. you recalculate the coordinates with spreadsheet commands, which I can explain
  71. if anyone out there is interested (be careful to replace the formulas with values
  72. via "Paste Special" in Excel before sorting, but keep a backup for the next
  73. molecule that you will add to the gene map).
  74.  
  75. 4) Note that you may need to do some Excel manipulations so that the lowest
  76. relative coordinate is always in the left-hand column (e.g., 9.44 is to left
  77. of 9.87 above), even though the above-mentioned gene map matrix export doesn't 
  78. export them in this way (my fault--I will try to fix this!).
  79.  
  80. 5) save in "CSV" format (comma-delimited text) or text tab-delimited format. Examine
  81. first with a text editor and strip quotation marks that Excel may have added.
  82.  
  83. 6) Create a new gene map from the menu of a gene mapping card in DNA Translator.
  84.  
  85. 7) Export multiple sequences for some protein-coding gene to Aligner stack. This
  86. will prompt you for choosing a genetic code for each genome mapped. Thereafter,
  87. it will be automatic.
  88.  
  89. To export the current matrix from a gene mapping card, select "Export Map Data"
  90. from the Edit menu.
  91.  
  92. Please send suggestions, improvements, new map matrices (i.e., as exported from
  93. DNA Translator in a file attached to email) to:
  94.  
  95. DEernisse@fullerton.edu
  96.